Gemini 3.5 Flashのピーキーな動作
Gemini 3.5 Flashから頭空っぽな方が夢詰め込める状態の気配
問題点
3.5 Flashは標準モードだと足し算を間違える
https://gyazo.com/6c5928c6a96d0a0e0c930d021a8d2752
さすがに知能がカス過ぎる
拡張モードだと正解
Gemini 3.1 Flash-Liteでも拡張モードでは正解
3.x自体の問題か?
比較
Google AI StudioでGemini 2.5 Flashに同じ問題を投げたらThinkingをオフにしても正解した
演算能力が劣化している
なんでさ
AIモード(Google)(グラウンディングに望みを託す)を問い詰めたところ、「2.5は自前の知識に回答があったんじゃねーの?」という回答だった。
そんな都合の良いことがあってたまるか
少なくとも標準モードは計算力がカスでハルシネーションをバキバキに発生させるモデルだと判明。
Flash Liteでも同じ結果になるのだからGemini アプリ上では一切立ち止まらずに高速回答をするのが標準モードの仕様になっている可能性が高い
この省推論設計を理解しないと痛い目を見ることになりそうだ
Geminiの新UIにおける標準モードと拡張モード選択の重要性
自動モードをください
早急に